计算机使信息传递的速度大大加快,而计算机对语言文字处理的“能力”却相对滞后。计算机进行汉语信息处理会遇到很多难点,例如没有词的界限标记,需要解决词的自动切分问题;没有形态变化标记,计算机难于分析词与词之间句法与语义关系;词类划分和兼类情况复杂,词性自动判别和标注困难;汉语句子和语义层次的分析处理更是困难重重。
如今,计算机汉语信息处理的诸多难点引起了各方面专家的关注。经过清华大学计算机系、北京大学计算机系、中国社会科学院语言研究所等11个单位的20几位专家、学者的论证,一项由国家语委承担的国家社科基金语言学科“九五”重大课题《信息处理用现代汉语词汇研究》开始启动。该课题将用三年时间完成,分自动分词研究、词类研究、词义研究三个方面。这项研究将对我国中文信息处理技术的发展以及应用语言学科的建设起到巨大的推动作用。
(唐旬张景义)